#ataques adversarios

Agentes Adversarios: Ataques de Evasión con Aprendizaje por Refuerzo

Descubre cómo un agente de aprendizaje por refuerzo aprende a atacar modelos de IA con mayor eficacia, aumentando el éxito de ataques de evasión hasta un 13.2%.

2026-06-06 · 2 min

Ataques adversarios en ASR más allá de la forma de onda

Nuevo ataque adversario en ASR evade defensas al perturbar representaciones SSL, mejorando la transferibilidad como en Whisper.

2026-06-06 · 2 min

Mejorando la seguridad de las interfaces cerebro-computadora

Modelo ligero de CNN mejora la robustez de interfaces cerebro-computadora ante ataques adversarios. Asegura un despliegue confiable.

2026-06-03 · 2 min

La Maldición de la Alineación: transferencia de texto potencia ataques de audio

La alineación entre texto y audio en modelos omni permite transferir ataques de jailbreak, aumentando riesgos de seguridad. Descubre cómo.

2026-06-02 · 2 min

Agente en navegador de Anthropic: 31.5% de secuestro antes de salvaguardas

Descubre por qué el agente de Anthropic fue secuestrado el 31.5% del tiempo y cómo se comparan OpenAI, Google y Meta en seguridad de prompts.

2026-06-02 · 2 min

Acordes Geométricos Latentes para Ataques Adversarios Eficientes

Descubre cómo los Acordes Geométricos Latentes (LGC) optimizan ataques adversarios con alta fidelidad visual y mínimas perturbaciones. SSIM > 0.99 y LPIPS < 0.01.

2026-06-01 · 2 min

SAEmnesia: eliminación precisa de conceptos en modelos de difusión

Descubre SAEmnesia, un marco que elimina conceptos en modelos de difusión con precisión y eficiencia, reduciendo la búsqueda de hiperparámetros en un 96.67%.

2026-06-01 · 2 min

¿Puede el Aprendizaje Federado Cuántico soportar puertas traseras a nivel de circuito?

¿Puede el Aprendizaje Federado Cuántico resistir puertas traseras a nivel de circuito? Descubre los retos de seguridad y las defensas en esta investigación cuántica.

2026-05-29 · 3 min